<html>
 <head>
  <meta charset="utf-8"/>
  <meta content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no" name="viewport"/>
  <title>
   施涛 – 第2页 – 从数据中看规律 | 数螺 | NAUT IDEA
  </title>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap-theme.min.css" rel="stylesheet"/>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap.min.css" rel="stylesheet"/>
  <style type="text/css">
   #xmain img {
                  max-width: 100%;
                  display: block;
                  margin-top: 10px;
                  margin-bottom: 10px;
                }

                #xmain p {
                    line-height:150%;
                    font-size: 16px;
                    margin-top: 20px;
                }

                #xmain h2 {
                    font-size: 24px;
                }

                #xmain h3 {
                    font-size: 20px;
                }

                #xmain h4 {
                    font-size: 18px;
                }


                .header {
	           background-color: #0099ff;
	           color: #ffffff;
	           margin-bottom: 20px;
	        }

	        .header p {
                  margin: 0px;
                  padding: 10px 0;
                  display: inline-block;  
                  vertical-align: middle;
                  font-size: 16px;
               }

               .header a {
                 color: white;
               }

              .header img {
                 height: 25px;
              }
  </style>
  <script src="http://cdn.bootcss.com/jquery/3.0.0/jquery.min.js">
  </script>
  <script type="text/x-mathjax-config">
   MathJax.Hub.Config({tex2jax: {inlineMath: [['$','$'], ['\\(','\\)']], processEscapes: true}});
  </script>
  <script src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=TeX-AMS-MML_HTMLorMML%2CSafe.js&amp;ver=15f5e1fcddf0b88517244c085cc07855" type="text/javascript">
  </script>
  <script src="http://nautstatic-10007657.file.myqcloud.com/static/css/readability.min.js" type="text/javascript">
  </script>
  <script type="text/javascript">
   $(document).ready(function() {
                 var loc = document.location;
                 var uri = {
                  spec: "http://blog.cos.name/taoshi/author/taoshi/page/2/",
                  host: "http://blog.cos.name",
                  prePath: "http://blog.cos.name",
                  scheme: "http",
                  pathBase: "http://blog.cos.name/"
                 };
    
                 var documentClone = document.cloneNode(true);
                 var article = new Readability(uri, documentClone).parse();
     
                 document.getElementById("xmain").innerHTML = article.content;
                });
  </script>
  <!-- 1466463007: Accept with keywords: (title(0.5):数据,规律, topn(0.5):大家,曲线,江湖,统计学,基尼系数,差距,数据挖掘,音标,数据分析,盲盲,模型,学生,计算,统计局,中国,方法,群体,同学,置信区间,样本,问题,算法,随机,算子,伦茨,百度,统计数据,数据,分类,小朋友).-->
 </head>
 <body class="archive paged author author-taoshi author-3 paged-2 author-paged-2 light-theme-pale-blue suffusion-custom preset-1000px device-desktop" onload="">
  <div class="header">
   <div class="container">
    <div class="row">
     <div class="col-xs-6 col-sm-6 text-left">
      <a href="/databee">
       <img src="http://nautidea-10007657.cos.myqcloud.com/logo_white.png"/>
      </a>
      <a href="/databee">
       <p>
        数螺
       </p>
      </a>
     </div>
     <div class="hidden-xs col-sm-6 text-right">
      <p>
       致力于数据科学的推广和知识传播
      </p>
     </div>
    </div>
   </div>
  </div>
  <div class="container text-center">
   <h1>
    施涛 – 第2页 – 从数据中看规律
   </h1>
  </div>
  <div class="container" id="xmain">
   <nav class="tab fix" id="nav-top">
    <div class="col-control left">
     <ul class="sf-menu">
      <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-home menu-item-1587 dd-tab" id="menu-item-1587">
       <a href="http://blog.cos.name/taoshi">
        首页
       </a>
      </li>
      <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-1590 dd-tab" id="menu-item-1590">
       <a href="http://blog.cos.name/taoshi/about/">
        关于
       </a>
      </li>
      <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-1588 dd-tab" id="menu-item-1588">
       <a href="http://statisticsforfun.com">
        English
       </a>
      </li>
     </ul>
    </div>
    <!-- /.col-control -->
   </nav>
   <!-- /#nav-top -->
   <div class="fix" id="wrapper">
    <div class="custom-header fix" id="header-container">
     <header class="fix" id="header">
      <h1 class="blogtitle left">
       <a href="http://blog.cos.name/taoshi">
        从数据中看规律
       </a>
      </h1>
      <div class="description right">
       快乐统计数据分析
      </div>
     </header>
     <!-- /header -->
     <nav class="tab fix" id="nav">
      <div class="col-control left">
       <!-- right-header-widgets -->
       <div class="warea" id="right-header-widgets">
        <form action="http://blog.cos.name/taoshi/" class="searchform " method="get">
        </form>
       </div>
       <!-- /right-header-widgets -->
       <ul class="sf-menu">
        <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-home menu-item-1587 dd-tab">
         <a href="http://blog.cos.name/taoshi">
          首页
         </a>
        </li>
        <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-1590 dd-tab">
         <a href="http://blog.cos.name/taoshi/about/">
          关于
         </a>
        </li>
        <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-1588 dd-tab">
         <a href="http://statisticsforfun.com">
          English
         </a>
        </li>
       </ul>
      </div>
      <!-- /col-control -->
     </nav>
     <!-- /nav -->
    </div>
    <!-- //#header-container -->
    <div class="fix" id="container">
     <div id="main-col">
      <div class="hfeed" id="content">
       <section class="author-profile author-even post fix" id="author-profile-taoshi">
        <header class="post-header">
         <h2 class="author-title">
          施涛
         </h2>
        </header>
        <div class="author-description">
         <img src="http://2.gravatar.com/avatar/2aab1cbecbe1dce1f66ef31db4c656c1?s=96&amp;d=identicon&amp;r=g"/>
         <p class="author-bio fix">
         </p>
         <!-- /.author-bio -->
        </div>
        <!-- /.author-description -->
       </section>
       <!-- /.author-profile -->
       <article class="full-content post-2254 post type-post status-publish format-standard hentry category-3 tag-133 category-3-id post-seq-1 post-parity-odd meta-position-corners fix" id="post-2254">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2013/04/30/%e4%b8%8e%e6%95%b0%e5%ad%97%e6%97%a0%e5%85%b3/" rel="bookmark" title="与数字无关">
            与数字无关
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e9%97%b2%e6%89%af/" rel="category tag">
             闲扯
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2013/04/30/%e4%b8%8e%e6%95%b0%e5%ad%97%e6%97%a0%e5%85%b3/#comments">
             4 Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           4月
          </span>
          <span class="day">
           30
          </span>
          <span class="year">
           2013
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2013-04-30T16:14:23+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           算算在国内也呆两个多月了，有一点小迷惑。
          </p>
          <p>
           首先自我检讨一下，这几个月除了坚持和学生通过skype讨论研究问题，和北京的合作者讨论几个新问题之外，自己没能在具体研究上有什么突破。检讨完毕，迷惑开始。
          </p>
          <p>
           要说是休息好了，但好像也没有。要说每天有很多事，好像也没有。总之觉得就是没有头绪的瞎忙，到底是为什么呢？表面上看是生活和工作安排中不确定性相对高，按
           <a href="http://www.math.pku.edu.cn/teachers/dayue/" target="_blank">
            大岳
           </a>
           的话说就是“常有惊喜”。除了每天接送小孩上下学和主持讨论班雷打不动，以及与学生skype基本固定外，其他的事情基本上都是几天前或当天才安排或被安排的。
          </p>
          <p>
           说小事几件：
          </p>
          <p>
           某天下午3点幼儿园短信通知第二天要给小朋友带个篮球，只好跳过晚饭去买球。另一天下午4点通知第二天要带花种去学校，只好马上到处打听花仙子在哪了？最后还是半夜在过街天桥下找到了。
          </p>
          <p>
           系里一位老师周一被通知去开会，但发现刚好有课只好找人代替。老师发现我做的东西还沾点边，下午给我打了个电话，我就被报名了。会议组织者几分钟后打来电话说明情况。我正想收集材料准备一下，被告知会议就是明天，不是下周二。只好第二天硬着头皮就去了。
          </p>
          <p>
           听说了一个读书会，准备去蹭一下。想问主讲人一下时间地点，却发现还没有找到场地，就忽然变成跑场地的了。
          </p>
          <p>
           这也从另一个角度说明中国的飞速发展和日新月异。大家做事很有效率，而且机会也很多。很多事都有只争朝夕的感觉。身边的人都很忙（乱），自己不自觉就也像陀螺似的转起来了。从小朋友到他们的爷爷奶奶，从小学生到大学教授，从底层员工的到公司老总，越往上越忙。
          </p>
          <p>
           想起李宗盛的一首老歌，
           <em>
            <strong>
             <a href="http://www.xiami.com/song/19347" target="_blank">
              忙与盲
             </a>
            </strong>
           </em>
          </p>
          <blockquote>
           <p>
            曾有一次晚餐和一张床
            <br/>
            在什么时间地点和哪个对象
            <br/>
            我已经遗忘 我已经遗忘
            <br/>
            生活是肥皂香水眼影唇膏
            <br/>
            许多的电话在响
            <br/>
            许多的事要备忘
            <br/>
            许多的门与抽屉开了又关关了又开
            <br/>
            如此的慌张
            <br/>
            我来来往往 我匆匆忙忙
            <br/>
            从一个方向到另一个方向
            <br/>
            忙忙忙 忙忙忙
            <br/>
            忙是为了自己的理想
            <br/>
            还是为了不让别人失望
            <br/>
            盲盲盲 盲盲盲
            <br/>
            盲得已经没有主张
            <br/>
            盲得已经失去方向
            <br/>
            忙忙忙 盲盲盲
            <br/>
            忙得分不清欢喜和忧伤
            <br/>
            忙得没有时间痛哭一场
           </p>
          </blockquote>
          <p>
           原来早就是这样了！只是不知怎么能空出些时间来沉淀一下心情。
          </p>
          <p>
           忙不怕，就怕盲（瞎忙）。我好像就是盲在其中了。
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 16:14
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/%e5%bf%99%e4%b8%8e%e7%9b%b2/" rel="tag">
           忙与盲
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-1907 post type-post status-publish format-standard hentry category-61 category-23 category-84 category-66 category-76 tag-180 tag-130 tag-131 tag-132 category-61-id category-23-id category-84-id category-66-id category-76-id post-seq-2 post-parity-even meta-position-corners fix" id="post-1907">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2013/04/05/%e4%b8%89%e6%9c%88%e7%bb%9f%e8%ae%a1%e4%b9%8b%e9%83%bd%e6%b2%99%e9%be%99%e8%a7%81%e9%97%bb/" rel="bookmark" title="三月统计之都沙龙见闻">
            三月统计之都沙龙见闻
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/" rel="category tag">
             数据分析
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e6%8c%96%e6%8e%98/" rel="category tag">
             数据挖掘
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1/" rel="category tag">
             统计
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1%e5%ba%94%e7%94%a8/" rel="category tag">
             统计应用
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e8%81%8c%e4%b8%9a%e4%bb%8b%e7%bb%8d/" rel="category tag">
             职业介绍
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2013/04/05/%e4%b8%89%e6%9c%88%e7%bb%9f%e8%ae%a1%e4%b9%8b%e9%83%bd%e6%b2%99%e9%be%99%e8%a7%81%e9%97%bb/#comments">
             2 Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           4月
          </span>
          <span class="day">
           05
          </span>
          <span class="year">
           2013
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2013-04-05T00:30:43+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           两星期前和
           <a href="http://weibo.com/u/1862459915" target="_blank">
            西二旗著名民工
           </a>
           参加了
           <a href="http://cos.name" target="_blank">
            统计之都
           </a>
           举办的沙龙活动。在沙龙中能同时与业界工作的朋友和在校学生进行交流，收获很多。首先要谢谢统计之都参加这次活动的组织者。之后忙于各种闲事而未能总结，现在补上。
          </p>
          <p>
           我先从
           <a href="http://cos.name/about/" target="_blank">
            统计之都的主页
           </a>
           上抄一段：
          </p>
          <blockquote>
           <p>
            纵观现今国内统计学理论和应用的发展，一方面我们不难发现统计学在应用领域的巨大潜力——现代管理、咨询、商业、经济、金融、医药、生物等等，无不需要数据的力量，而另一方面我们也不得不承认，国内统计学的应用很大程度上受理论的制约——无论是应用界的人们对统计学基础理论知识的欠缺，还是学术界所研究的理论对应用领域问题的轻视。
           </p>
          </blockquote>
          <p>
           我感觉把上面文字中的“统计学”改成“数据科学”也不太偏颇。
          </p>
          <p>
           言归正传，首先大家各自介绍门派，在这中间就听到工业界对数据分析能力的需求，好像大家都有数据可分析。百度，腾讯，京东，品友等等就算了吧，新华社也要凑热闹，好吧。面对网络信息和电子商务带来的大量数据，大家很关心的问题就是如何从它们中提取出有用的信息来（当然能变现就更好了）。
          </p>
          <p>
           讨论当然是以向
           <a href="http://weibo.com/u/1862459915" target="_blank">
            西二旗民工余凯
           </a>
           讨教最近如火如荼的Deep Learning开始了。余凯给大家介绍了Deep Learning和Neural Networks以及它们在百度多媒体方面的应用。其中提到的语音输入和全网搜图很神奇。虽然没细讲，我还是觉得余凯提到的浮点计算和定点计算很有趣。我们做统计的平时是很少去考虑这些计算速度和精度的平衡的。
          </p>
          <p>
           工业界的朋友提到招到的学生开始时不懂业务，只懂公式。同时在校学生也提出觉学得不实际，不知学到的方法公式在实际中怎么用。那怎么办呢？靠天靠地不如靠自己哦。见到有趣的问题，可以上手的数据，就拿来试试先。另外走出校园，到公司或其他单位实习一下也可能会很有帮助。虽然教育和社会需求的接轨可能要一定时间和过程，但个人的主观能动性还是很有潜力的。
          </p>
          <p>
           作为统计专科的学生，学些数据库知识，多练习一下编程，再加上些对实际问题的了解，应该是大有用武之地的。
          </p>
          <p>
           沙龙也来很多原来从事别的行业而后来转进数据分析行业的人士，比如这次
           <a href="http://weibo.com/lseaman" target="_blank">
            品友来的数据架构师
           </a>
           以前就研究火星电离层的（不明觉厉）。还有写了
           <a href="http://cos.name/2013/01/story-of-normal-distribution-1/" target="_blank">
            正态分布的前世今生
           </a>
           和
           <a href="http://cos.name/2013/01/lda-math-gamma-function/" target="_blank">
            LDA系列
           </a>
           的
           <a href="http://weibo.com/rickjin" target="_blank">
            rickjin
           </a>
           也不是统计专科出身的。不论原来是做什么专科的，大家在用数据分析问题，解决问题，再提出问题这个屋檐下开心的交流了一个下午。
          </p>
          <p>
           数据分析在中国的大规模应用这几年才刚刚开始，但是发展飞速。希望以后能更多看到这样对其发展有促进作用的沙龙活动。最后再次感谢组织这次活动的
           <a href="http://weibo.com/taiyun" target="_blank">
            统计制度小二
           </a>
           。
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 00:30
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/%e6%95%b0%e6%8d%ae%e6%8c%96%e6%8e%98/" rel="tag">
           数据挖掘
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e6%b2%99%e9%be%99/" rel="tag">
           沙龙
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e7%bb%9f%e8%ae%a1%e4%b9%8b%e9%83%bd/" rel="tag">
           统计之都
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e7%bb%9f%e8%ae%a1%e6%95%99%e8%82%b2/" rel="tag">
           统计教育
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-2173 post type-post status-publish format-standard hentry category-63 category-61 category-84 category-66 tag-128 tag-127 tag-126 category-63-id category-61-id category-84-id category-66-id post-seq-3 post-parity-odd meta-position-corners fix" id="post-2173">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2013/02/04/%e4%b8%ad%e5%9b%bd%e5%9f%ba%e5%b0%bc%e7%b3%bb%e6%95%b0%e4%bc%b0%e7%ae%97/" rel="bookmark" title="中国基尼系数估算中的统计问题">
            中国基尼系数估算中的统计问题
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e5%aa%92%e4%bd%93%e6%8a%a5%e9%81%93/" rel="category tag">
             媒体报道
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/" rel="category tag">
             数据分析
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1/" rel="category tag">
             统计
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1%e5%ba%94%e7%94%a8/" rel="category tag">
             统计应用
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2013/02/04/%e4%b8%ad%e5%9b%bd%e5%9f%ba%e5%b0%bc%e7%b3%bb%e6%95%b0%e4%bc%b0%e7%ae%97/#comments">
             5 Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           2月
          </span>
          <span class="day">
           04
          </span>
          <span class="year">
           2013
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2013-02-04T09:00:13+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           看了基尼系数被吵的沸沸扬扬，咱也来掺糊一下。先从
           <a href="http://baike.baidu.com/view/186.htm" target="_blank">
            百度百科上抄一段
           </a>
           ：
          </p>
          <blockquote>
           <p>
            基尼系数（Gini coefficient），或译坚尼
            <a href="http://baike.baidu.com/view/960.htm" target="_blank">
             系数
            </a>
            ，是20世纪初意大利
            <a href="http://baike.baidu.com/view/31551.htm" target="_blank">
             经济学
            </a>
            家基尼，根据
            <a href="http://baike.baidu.com/view/3367636.htm" target="_blank">
             劳伦茨曲线
            </a>
            所定义的判断
            <a href="http://baike.baidu.com/view/604597.htm" target="_blank">
             收入
            </a>
            <a href="http://baike.baidu.com/view/4646736.htm" target="_blank">
             分配公平
            </a>
            程度的
            <a href="http://baike.baidu.com/view/605645.htm" target="_blank">
             指标
            </a>
            。是
            <a href="http://baike.baidu.com/view/339062.htm" target="_blank">
             比例
            </a>
            数值，在0和1之间，是国际上用来综合考察
            <a href="http://baike.baidu.com/view/10427.htm" target="_blank">
             居民
            </a>
            内部
            <a href="http://baike.baidu.com/view/604597.htm" target="_blank">
             收入
            </a>
            分配差异状况的一个重要分析指标。
           </p>
           <p>
            2012年12月初，
            <a href="http://baike.baidu.com/view/4906.htm" target="_blank">
             西南财经大学
            </a>
            中国家庭金融调查在京发布的报告显示，2010年中国家庭的基尼系数为0.61，大大高于0.44的全球平均水平。2013年
            <a href="http://baike.baidu.com/view/171909.htm" target="_blank">
             国家统计局
            </a>
            局长
            <a href="http://baike.baidu.com/view/491534.htm" target="_blank">
             马建堂
            </a>
            公布了过去十年中国基尼系数，系数导向意义引发关注。
           </p>
          </blockquote>
          <p>
           关于同一指数的两个差异很大的（点）估计，让大家有些摸不到头脑。对这两个不同估计的报道在这可以找到：
          </p>
          <ul>
           <li>
            <a href="http://finance.sina.com.cn/china/20121209/092913944148.shtml">
             2012年12月9日
            </a>
            ，媒体开始报道西南财经大学中国家庭金融调查在京发布的报告， 调查显示中国基尼系数达0.61。一时议论纷纷。这个“基尼系数”的微指数也随之飙升。
           </li>
           <li>
            <a href="http://finance.sina.com.cn/china/bwdt/20130118/124114331770.shtml" target="_blank">
             2013年1月18日
            </a>
            ，统计局：去年基尼系数为0.474 自08年起逐年回落。 公布当天，“基尼系数”的微指数更上一层楼。
           </li>
          </ul>
          <p>
           <a href="http://i.imgur.com/ZyF0Ux3.jpg">
            <img src="http://i.imgur.com/ZyF0Ux3.jpg"/>
           </a>
          </p>
          <p>
           而且和“统计局”的微指数还有些惺惺相惜。
          </p>
          <p>
           <img src="http://i.imgur.com/RveMZCi.png"/>
          </p>
          <p>
           那这基尼系数到底是个神马东西呢？根据在 Wikipedia 上的学习，让我来班门弄斧的解释一下（经济学家的砖头请等会在扔）
          </p>
          <p>
           首先，这个系数是关于一群 ($n$个) 人的，用统计的话讲，
           <strong>
            它是个总体的一个特征
           </strong>
           （你要叫参数也行）。对这群人咋定义这基尼系数呢？
          </p>
          <p>
           假设所有人的收入从小到大排序后是 $\{X_1, X_2, \ldots, X_n\}$， 到第 j 人为止的累计收入为 $\{S_j = X_1 + X_2 + \cdots + X_j,$ $ j=1, 2, \ldots, n\}$。到这了索性再把累计收入占人群总收入的比例$\{R_j = S_j / S_n, j=1, 2, \ldots, n\}$也一起算了。然后就可以画大名鼎鼎的
           <a href="http://en.wikipedia.org/wiki/Lorenz_curve" target="_blank">
            劳伦茨曲线
           </a>
           了，其实就是把$\{1/n, 2/n, \ldots, n/n \}$ 和$\{R_1, R_2, \ldots, R_n\}$匹配一下画个散点图（在R中用”l”选项就成线了），也就有了下面的Lorenz Curve。
          </p>
          <p style="text-align: center">
           <a href="http://en.wikipedia.org/wiki/Gini_coefficient">
            <img src="http://i.imgur.com/6cjwgLv.png"/>
           </a>
          </p>
          <p>
          </p>
          <p>
           如果收入绝对公平，$X_1=X_2=\cdots =X_n$，那这曲线就被掰直了（图中的Line of Equality）。劳伦茨曲线越靠近该直线就代表人群中的收入越平均。反之就越不平均。怎么刻画这两条线之间的差距呢？基尼系数就应运而生了：图中两条线中的面积（$A$）占总面积（$A+B$) 的比例
          </p>
          <p>
           \[\frac{A}{A+B}\]
          </p>
          <p>
           就是这神奇的系数了。
          </p>
          <p>
           按理说这基尼系数对国民经济刻画还是应该有些作用的，比如：联合国有关组织规定：通常把0.4作为收入分配差距的“警戒线”，0.6以上表示收入差距悬殊。
          </p>
          <p>
           对自己科普了之后，就好理解不同报道中的差异了。既然基尼系数是人群（国家）总体特征，要算它就的知道
           <strong>
            每个人
           </strong>
           的“
           <strong>
            收入
           </strong>
           ”。去把每个人收入数据搞齐费时费力，可能人都把十年前的收入忘了时，还没被问到呢。咋办呢？这个咱在行：抽样调查然后统计估计！这也就有了不同的抽样调查得到不同结果的情况了。
          </p>
          <p>
           结果不完全相同当然没问题，是抽样就有误差。但当两个试图估计同样总体特征的估计值之间得差距大到抽样误差没法解释的程度（有法解释吗？），那旁观者也就只好认定最少其中一个是不准确的了（当然也没法排除两个都不准确的可能性）。
          </p>
          <p>
           于是也就有了2013年2月2号的释疑文章：
           <a href="http://news.sina.com.cn/c/2013-02-02/023926181923.shtml?bsh_bid=189552118" target="_blank">
            统计局官员撰文释疑我国基尼系数数据来源
           </a>
           。
          </p>
          <ul>
           <li>
            国家统计局住户调查办公室主任王萍萍发表署名文章进行解释，称我国城乡住户收支调查共有14万户样本，这是基尼系数的基础数据。而这些数据来源明确，样本规范。
           </li>
           <li>
            王萍萍文中介绍，新指标是指2012年12月份以后实施的一体化住户调查制度中的可支配收入指标。新的可支配收入指标中既包括现金收入，也包括实物收入。按照来源可分为：
            <strong>
             工资性收入、经营净收入、财产净收入、转移净收入和自有住房折算净租金。
            </strong>
           </li>
           <li>
            在城乡合并样本数据的基础上，依据基尼系数计算公式，利用SAS(统计分析系统)软件计算出了全体居民的可支配收入基尼系数。
           </li>
          </ul>
          <p>
           如果有人有闲往这些页面下部的“我有话说”看一下，就还真得对统计局捏把汗。
          </p>
          <p>
           不管统计局得数据多么来源明确，样本规范，看官就是不信，而且好像没有一个信的。撇开对对样本规范的看法，大家对统计局对“收入”的官方定义都不怎么买帐，这也是统计局工作的为难之处：在现在的社会现实情况下去抽个样本了解收入。
          </p>
          <p>
           要是你今天有幸被抽中，你会怎么回答呢？这还真不是统计局能单独解决的问题。（另外，SAS也很不幸得躺着中了一枪 :)）
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 09:00
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/%e5%8a%b3%e4%bc%a6%e8%8c%a8%e6%9b%b2%e7%ba%bf/" rel="tag">
           劳伦茨曲线
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%8f%82%e6%95%b0%e4%bc%b0%e8%ae%a1/" rel="tag">
           参数估计
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%9f%ba%e5%b0%bc%e7%b3%bb%e6%95%b0%ef%bc%8c%e7%bb%9f%e8%ae%a1%e5%b1%80%ef%bc%8c%e5%be%ae%e6%8c%87%e6%95%b0/" rel="tag">
           基尼系数，统计局，微指数
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-2151 post type-post status-publish format-standard hentry category-84 category-124 category-84-id category-124-id post-seq-4 post-parity-even meta-position-corners fix" id="post-2151">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2013/01/17/tao-of-statistics/" rel="bookmark" title="统计之道">
            统计之道
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1/" rel="category tag">
             统计
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e8%af%bb%e4%b9%a6/" rel="category tag">
             读书
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2013/01/17/tao-of-statistics/#comments">
             4 Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           1月
          </span>
          <span class="day">
           17
          </span>
          <span class="year">
           2013
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2013-01-17T11:25:42+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           这几天第三遍翻起这本书名宏大的小册子：
           <a href="http://www.amazon.com/The-Tao-Statistics-Path-Understanding/dp/1412924731/">
            The Tao of Statistics: A Path to Understanding (With No Math)
           </a>
           by
           <a href="http://www.halcyonresearch.com" target="_blank">
            Dana K. Keller
           </a>
           . 当然当年买这本书时也不光是看到书名里有”Tao” 这个关键词。
          </p>
          <p>
           <img src="http://i.imgur.com/3EDji.jpg"/>
          </p>
          <p>
           如书名所言，这本讲统计书中真的是一点数学都没有。每一章开篇一幅画，几句歪总结，然后一两段介绍，外加一两个例子。
          </p>
          <p>
           <img src="http://i.imgur.com/H17ZG.jpg"/>
           <img src="http://i.imgur.com/r56ln.jpg"/>
          </p>
          <p>
           有兴趣的话，可以在google book上翻一下一些
           <a href="http://books.google.com/books?id=vyu0bpUJIsMC&amp;printsec=frontcover#v=onepage&amp;q&amp;f=false" target="_blank">
            预览页
           </a>
           。看了就相信的，真的没有数学，一个公式都没有。
          </p>
          <p>
           翻过几遍这本书后，我觉得书中对一些统计学和统计概念的描述还是挺值得一提的。摘抄一点：
          </p>
          <blockquote>
           <p>
            Statistics are filters on how we see the world. They focus our vision, and they help us to see through the fog. In doing so, they also prevent us from seeing some of what else is there. Stay aware of what is being filtered out, too.
           </p>
           <p>
            You do not need to know how to calculate statistics to understand what they are telling you.
           </p>
           <p>
            Averages do not exist from most things. They are only ideas. A truly average person does not exits. The idea of an average is what is useful.
           </p>
           <p>
            The rest of statistics is no more real than averages. Regardless of how technical a statistic sounds, it is still only an idea that can be grasped by all.
           </p>
           <p>
            The world of statistics has become technically complex. When someone produces a statistic that you have never heard of or seen before, simply ask what it does and for an example that demonstrates its usefulness.
           </p>
           <p>
            Ideas lead to understanding. Experiencing the ideas of statistics motives us to develop and deepen our understanding of them.
           </p>
          </blockquote>
          <p>
           如果你相信机器翻译，可以看看百度翻译：
          </p>
          <blockquote>
           <p>
            统计数字滤波器对我们如何看待世界。他们把我们的视觉，他们帮助我们看到通过雾。在这样做时，他们也阻止我们看看还有什么。了解被过滤出来，太。
           </p>
           <p>
            你不需要知道如何计算的统计数据了解他们告诉你的。
           </p>
           <p>
            平均数不能从大多数的东西存在。他们是唯一的想法。一个真正的一般人不存在。一个普通的想法是有用的东西。
           </p>
           <p>
            统计的休息是没有比平均更真实。无论怎样的技术统计的声音，它仍然只是一个想法，可以掌握的一切。
           </p>
           <p>
            统计数据已成为世界上技术上是复杂的。当有人生产，你从来没有听说过或看到过一个统计，简单地问它做什么和一个示例，演示它的用处。
           </p>
           <p>
            思想导致的理解。体验统计动机我们发展和加深理解他们的想法。
           </p>
          </blockquote>
          <p>
           或Google 翻译：
          </p>
          <blockquote>
           <p>
            统计信息是我们如何看世界的过滤器。他们注重我们的视野，他们帮我们看的透雾。在这样做时，他们还可以防止我们看到一些还有什么。随时知道什么是被过滤掉，也。
           </p>
           <p>
            你并不需要知道如何计算统计数据，以了解他们告诉你什么。
           </p>
           <p>
            平均不存在的大多数事情。他们唯一的想法。一个真正的普通人不退出。平均的想法是什么是有用的。
           </p>
           <p>
            其余的统计数字比真实更真实的平均值。无论技术统计听起来如何，它仍然只是一个想法，可以掌握所有。
           </p>
           <p>
            世界上的统计已经成为复杂技术。当有人产生一个统计，你从来没有听说过或见过的，简单的让它做什么和为例，证明了它的实用性。
           </p>
           <p>
            理念引领理解。体验我们发展和深化我们了解他们的思想，统计的动机。
           </p>
          </blockquote>
          <p>
           从结束章中再搬一点：（算了，就不有劳各位机器翻译了，珍惜生命）
          </p>
          <blockquote>
           <p>
            With assumptions piled high
           </p>
           <p>
            Armed with knowledge and intuition
           </p>
           <p>
            Although mistakes can be made
           </p>
           <p>
            Don’t wager against a statistician
           </p>
          </blockquote>
          <p>
           这本书的好处是你用一个轻松的下午就翻完了，还不用推倒公式。但不好的一点是，买这本小册子要花费些银两（Amazon 要你用38来换，部分原因可能是由于那些图画和小发行量吧）。如果你不差钱，或者能在图书馆找到这本书，我推荐你在学习工作之余，享受一下这轻松一刻。
          </p>
          <p>
           差点忘了讲，这书的
           <a href="http://www.halcyonresearch.com" target="_blank">
            作者
           </a>
           也挺神的，统计博士，教授，某个公益组织的首席统计学家，研究道学30多年了，还在中国（西藏）教过书，致力于东西方文明交汇。
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 11:25
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-2122 post type-post status-publish format-standard hentry category-61 category-23 category-66 tag-bootstrape tag-michael-jordan tag-123 tag-64 category-61-id category-23-id category-66-id post-seq-5 post-parity-odd meta-position-corners fix" id="post-2122">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2012/12/18/%e5%a4%a7%e6%95%b0%e6%8d%ae%ef%bc%8c%e7%bb%9f%e8%ae%a1%e7%b2%be%e5%ba%a6%e4%b8%8e%e8%ae%a1%e7%ae%97%e5%a4%8d%e6%9d%82%e5%ba%a6/" rel="bookmark" title="大数据，统计精度与计算复杂度">
            大数据，统计精度与计算复杂度
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/" rel="category tag">
             数据分析
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e6%8c%96%e6%8e%98/" rel="category tag">
             数据挖掘
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1%e5%ba%94%e7%94%a8/" rel="category tag">
             统计应用
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2012/12/18/%e5%a4%a7%e6%95%b0%e6%8d%ae%ef%bc%8c%e7%bb%9f%e8%ae%a1%e7%b2%be%e5%ba%a6%e4%b8%8e%e8%ae%a1%e7%ae%97%e5%a4%8d%e6%9d%82%e5%ba%a6/#comments">
             7 Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           12月
          </span>
          <span class="day">
           18
          </span>
          <span class="year">
           2012
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2012-12-18T04:18:27+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           大数据好热好热啊！统计的时代好像飘然而至了。可我们准备好了吗？答案吗，当然还是，“it depends”。
          </p>
          <p>
           最近看到的很多在大数据上有进展的问题基本上是预测问题，比如：搜索问题，语音图像识别问题，推荐系统问题，广告放送问题，社交网络问题。。。 问题的答案和算法的结果一般是一个或一串预测值。算法也是百花齐放：各类回归，各类聚类，矩阵分解，深度学习。。。
          </p>
          <p>
           这些预测值的准确性基本是靠算法在独立验证数据集上的表现来刻画。忽然间统计的一些基本概念，像标准差，置信区间，一类二类错误，等等都被大数据淹没的无影无踪。当忽然间体会到理想很丰满，现实很骨感的书本与实践的差距时，摆弄惯了$1 / \sqrt{n}$ 的统计人（我也算一员）有些无所适从。
          </p>
          <p>
           在数据和算法当道的时代，有时不仅要问“大数据和统计还有关系吗？” 不妨听听这个报告：
          </p>
          <blockquote>
           <p>
            <em>
             加州大学伯克利分校电气工程与计算机系、统计学系教授Michael Jordan，在
             <a href="http://huati.weibo.com/k/21%E4%B8%96%E7%BA%AA%E7%9A%84%E8%AE%A1%E7%AE%97%E5%A4%A7%E4%BC%9A?from=510">
              #21世纪的计算大会#
             </a>
             上做”大数据的分治和统计推断”的主题演讲，就解决大数据集中获得置信区间和大型矩阵求全法的问题，提出了新的解决方案。
            </em>
           </p>
          </blockquote>
          <p>
           <embed align="middle" allowfullscreen="true" allowscriptaccess="always" height="400" quality="high" src="http://player.youku.com/player.php/sid/XNDg3ODE1MzU2/v.swf" type="application/x-shockwave-flash" width="480">
           </embed>
          </p>
          <p>
           讲座主要是讲大数据下统计和计算的结合问题，同时提出用subsample的方法在大数据上来建立bootstrape 置信区间的。对，不光是关心估计或预测，同时想给出置信区间。统计方法对不确定性的刻划在大数据一样重要，只不过大家还没有足够精力和计算能力来估计它。
          </p>
          <p>
           如果你没太听懂这讲座中提到的方法，没关系。可以跳到 33分钟听结尾的一席话。
          </p>
          <blockquote>
           <p>
            If you didn’t understand a lot of the talk, it is a bit technical, maybe you should go take some statistics class if you are a computer scientist. If you are a statistician, I don’t know if any of you are here, you probably should take some computer science classes.
           </p>
           <p>
            The future is for those people who can take these two fields and integrate them into one brain, not having to bring every project to statisticians, trying to have them talking to computer scientists using some translation software. But one brain can bring these ideas jointly together. How do I think about my statistical risk and the errors I’m going to make when data come into a computer and how do I think about stating that so I don’t have to break when I have more than a few hundred thousand data points.
           </p>
           <p>
            That’s just not what we have been teaching students. And, so, we are still not doing a good job in teaching students, and we may talk about that later. Even though there are classes on this, you guys can go and learn it by yourself. If you are taking computer science classes, take a few stats classes. Pick some books, sit them by your bed and read them every night, and make sure you can do these two things together. This is the future of the field.
           </p>
           <p>
            Thank you!
           </p>
          </blockquote>
          <p>
           既然报告中提到了翻译软件，我也就随机的试了一下百度翻译：
          </p>
          <blockquote>
           <p>
            如果你不懂的许多谈话，这是一个有点技术，也许你应该采取一些统计类如果你是电脑科学家。如果你是一个统计学家，我不知道如果你在这里，你也许应该采取一些计算机科学课。
           </p>
           <p>
            未来是为这些人谁可以把这两个领域和整合成一个大脑，不必把每一个项目的统计人员，想让他们谈论计算机科学家使用翻译软件。但一个大脑可以把这些想法联合在一起。我怎么觉得我的统计风险和错误，我要当数据进入计算机，我怎么想说，所以我没有休息的时候，我已经超过几十万的数据点。
           </p>
           <p>
            这不是我们所教学生。和，那么，我们还是做得不好的学生在教学中，我们可以谈一下。即使有课上，你们可以去学习一下。如果你是以计算机科学课，带几个属性类。拿一些书，坐在你的床上，他们每天晚上读他们，并确保你能做到这两件事一起。这是该领域的未来。
           </p>
           <p>
            谢谢！
           </p>
          </blockquote>
          <p>
           还不错。最后多说一句，第一次见Michael Jordan穿的如此正式 🙂
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 04:18
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/bootstrape/" rel="tag">
           bootstrape
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%a4%a7%e6%95%b0%e6%8d%ae%ef%bc%8cmichael-jordan/" rel="tag">
           大数据，Michael Jordan
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e7%bb%9f%e8%ae%a1%e6%8e%a8%e6%96%ad/" rel="tag">
           统计推断
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e7%bd%ae%e4%bf%a1%e5%8c%ba%e9%97%b4/" rel="tag">
           置信区间
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-2101 post type-post status-publish format-standard hentry category-63 category-61 category-84 category-3 tag-andrew-gelman tag-bayesian tag-frequentist tag-larry-wasserman tag-nate-silver tag-the-signal-and-the-noise category-63-id category-61-id category-84-id category-3-id post-seq-6 post-parity-even meta-position-corners fix" id="post-2101">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2012/12/07/frequentist-or-bayesian/" rel="bookmark" title="大话统计：Frequentist or Bayesian">
            大话统计：Frequentist or Bayesian
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e5%aa%92%e4%bd%93%e6%8a%a5%e9%81%93/" rel="category tag">
             媒体报道
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/" rel="category tag">
             数据分析
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1/" rel="category tag">
             统计
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e9%97%b2%e6%89%af/" rel="category tag">
             闲扯
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2012/12/07/frequentist-or-bayesian/#comments">
             1 Response »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           12月
          </span>
          <span class="day">
           07
          </span>
          <span class="year">
           2012
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2012-12-07T10:58:34+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           [前言：先向无法科学上网的客官作揖抱歉了，有些江湖野史可能被墙]
          </p>
          <p>
           话说江湖风云人物，神算子
           <a href="http://en.wikipedia.org/wiki/Nate_Silver" target="_blank">
            Nate Silver
           </a>
           ， 在纽约时报
           <a href="http://fivethirtyeight.blogs.nytimes.com" target="_blank">
            开博占卜
           </a>
           各项江湖话题，每每言中。并著书立传，
           <a href="http://www.us.penguingroup.com/static/pages/features/the_signal_and_the_noise.html" title="The Signal and the Noise - Books by Nate Silver - Penguin Group (USA)">
            The Signal and the Noise
           </a>
           ，一时引来
           <a href="http://cos.name/2012/11/the-rise-of-data-scientists/" target="_blank">
            各相追捧
           </a>
           。
          </p>
          <p>
           这日，曾留下武林秘籍
           <a href="http://www.amazon.com/All-Statistics-Statistical-Inference-Springer/dp/0387402721/" target="_blank">
            All of Statistics: A Concise Course in Statistical Inference
           </a>
           的大侠
           <a href="http://www.stat.cmu.edu/~larry/" target="_blank">
            Larry Wasserman
           </a>
           (Department of Statistics, Department of Machine Learning, Carnegie Mellon University) 突发感想，在自己博客
           <a href="http://normaldeviate.wordpress.com/" target="_blank">
            Normal Deviate
           </a>
           中写下大号书评：
          </p>
          <h2>
           <a href="http://taoshistat.wordpress.com/2012/12/06/2100/" rel="bookmark" title="Permanent Link to Nate Silver is a Frequentist: Review of ``the signal and the noise''">
            Nate Silver is a Frequentist: Review of “the signal and the noise”
           </a>
          </h2>
          <blockquote>
           <p>
            ［……］As you can see, I liked the book very much and I highly recommend it.
           </p>
           <p>
            But …
           </p>
           <p>
            I have one complaint. Silver is a big fan of Bayesian inference, which is fine. Unfortunately, he falls into that category I referred to
            <a href="http://normaldeviate.wordpress.com/2012/11/17/what-is-bayesianfrequentist-inference/">
             a few posts ago.
            </a>
            He confuses “Bayesian inference” with “using Bayes’ theorem.” His description of frequentist inference is terrible. He seems to equate frequentist inference with Fisherian significance testing, most using Normal distributions. Either he learned statistics from a bad book or he hangs out with statisticians with a significant anti-frequentist bias.
           </p>
           <p>
            Have no doubt about it: Nate Silver is a frequentist. For example, he says:
           </p>
           <p>
            <strong>
             “One of the most important tests of a forecast — I would argue that it is the single most important one — is called calibration. Out of all the times you said there was a 40 percent chance of rain, how often did rain actually occur? If over the long run, it really did rain about 40 percent of the time, that means your forecasts were well calibrated.”
            </strong>
           </p>
           <p>
            It does not get much more frequentist than that. And if using Bayes’ theorem helps you achieve long run frequency calibration, great. If it didn’t, I have no doubt he would have used something else. But his goal is clearly to have
            <strong>
             good long run frequency behavior
            </strong>
            .［……］
           </p>
          </blockquote>
          <p>
           一时间风雨突起，这个关于 Frequentist or Bayesian 的争议话题又现江湖。第一个杀出来的是？没错！正是大侠
           <a href="http://andrewgelman.com/" rel="external nofollow">
            Andrew Gelman
           </a>
           (Department of Statistics, Columbia University)，著名的
           <a href="http://andrewgelman.com/" title="Statistical Modeling, Causal Inference, and Social Science: ">
            Statistical Modeling, Causal Inference, and Social Science
           </a>
           的博主。
          </p>
          <blockquote>
           <p>
            Larry:
           </p>
           <p>
            There is such a thing as Bayesian calibration of probability forecasts. If you are predicting a binary outcome y.new using a Bayesian prediction p.hat (where p.hat is the posterior expectation E(y.new|y), then Bayesian calibration requires that E(y.new|y.hat) = y.hat for any y.hat. This isn’t the whole story (as always, calibration matters but so does precision), but it’s not the same as frequentist calibration or unbiasedness. In frequentist calibration, the expectation is taken conditional on the value of the unknown parameters theta in the model. The calibration you describe above (for another example, see
            <a href="http://andrewgelman.com/2010/11/some_thoughts_o_8/" rel="nofollow">
             here
            </a>
            and scroll down) is unconditional on theta, thus Bayesian. So I disagree with you that those calibrations are frequentist and not Bayesian. But of course I completely agree with you that the concept of frequency performance of methods is important. It’s just that Bayesian calibration does not condition on theta.
           </p>
          </blockquote>
          <p>
           江湖不宁，争论又起，各路人马
           <a href="http://normaldeviate.wordpress.com/2012/12/04/nate-silver-is-a-frequentist-review-of-the-signal-and-the-noise/#comments" target="_blank">
            加入论战
           </a>
           。大侠
           <a href="http://xianblog.wordpress.com" target="_blank">
            XI’AN’ OG
           </a>
           也出面提出把这场论战记入江湖册：
          </p>
          <blockquote>
           <p>
            Would you mind publishing this review in
            <a href="http://chance.amstat.org" target="_blank">
             CHANCE
            </a>
            , by any chance???
           </p>
          </blockquote>
          <p>
           看大侠们挥舞这各项理论和哲学思想，小的不尽倒吸一口凉气。
          </p>
          <p>
           问题原来是神算子是否属于少林派，还是武当派。怎么忽然就变成各派根据其所著之书，来统计推断其个人取向了呢？然后有演变为了两派镇派宝典根基的争论了。
          </p>
          <p>
           要是实在关心神算子心仪那派的问题，不如找来神算子本人问一下，到底人家对哪里更有归属感，不就行了。实在找不到本人，就@他，tweet 一下好了。。。。。。
          </p>
          <p>
           走你！
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 10:58
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/andrew-gelman/" rel="tag">
           Andrew Gelman
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/bayesian/" rel="tag">
           Bayesian
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/frequentist/" rel="tag">
           Frequentist
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/larry-wasserman/" rel="tag">
           Larry Wasserman
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/nate-silver/" rel="tag">
           Nate Silver
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/the-signal-and-the-noise/" rel="tag">
           The Signal and the Noise
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-2090 post type-post status-publish format-standard hentry category-63 category-62 tag-black-marble tag-nasa tag-virrs tag-112 tag-113 tag-114 category-63-id category-62-id post-seq-7 post-parity-odd meta-position-corners fix" id="post-2090">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2012/12/05/blue-marble-black-marble-our-planet/" rel="bookmark" title="白天不懂夜的黑">
            白天不懂夜的黑
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e5%aa%92%e4%bd%93%e6%8a%a5%e9%81%93/" rel="category tag">
             媒体报道
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%a7%91%e5%ad%a6/" rel="category tag">
             科学
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2012/12/05/blue-marble-black-marble-our-planet/#respond">
             No Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           12月
          </span>
          <span class="day">
           05
          </span>
          <span class="year">
           2012
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2012-12-05T22:44:05+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           大数据时代来了，但什么样的问题才需要大数据呢？我觉得答案挺直接的：大问题，没法简单抽样或抽样也没法解决的问题。
          </p>
          <p>
           今天很火爆的一张图是NASA用2.5兆兆字节(terabytes)卫星数据画的，地球的全球夜间灯光亮度图。
          </p>
          <div class="wp-caption aligncenter" style="width: 710px">
           <a href="http://eoimages.gsfc.nasa.gov/images/imagerecords/79000/79765/dnb_land_ocean_ice.2012.3600x1800.jpg">
            <img src="http://i.imgur.com/f6thJ.jpg"/>
           </a>
           <p class="wp-caption-text">
            Credit: Visible Infrared Imaging Radiometer Suite (NASA)
           </p>
          </div>
          <p>
           数据是NASA的
           <a href="http://npp.gsfc.nasa.gov/viirs.html" rel="bookmark" target="_blank">
            Visible Infrared Imaging Radiometer Suite
           </a>
           在今年4月和10月收集的，然后要经过一系列处理，去除极光，森林着火的火光，月光反射，等等各种光线，剩下的是估计的城市光线。
          </p>
          <blockquote>
           <p>
            The night time view of Earth was made possible by the “day-night band” of the
            <a href="http://npp.gsfc.nasa.gov/viirs.html" rel="bookmark" target="_blank">
             Visible Infrared Imaging Radiometer Suite
            </a>
            . VIIRS detects light in a range of wavelengths from green to near-infrared and uses filtering techniques to observe dim signals such as gas flares, auroras, wildfires, city lights, and reflected moonlight. In this case, auroras, fires, and other stray light have been removed to emphasize the city lights.
           </p>
          </blockquote>
          <p>
           这个我觉得是大数据的一个强项。要画这么精确，高分辨率的图，没有所有的数据和认真的分析是没法想象的。NASA提供的最高分辨率的图在这里(
           <a href="http://eoimages.gsfc.nasa.gov/images/imagerecords/79000/79765/dnb_land_ocean_ice.2012.54000x27000_geo.tif" target="_blank">
            384 MB, TIFF, 54000×27000
           </a>
           )，没有足够内存建议别碰。不过NASA搞了个灰常了得的幻灯片
           <a href="http://www.flickr.com//photos/gsfc/sets/72157632175125121/show/" target="_blank">
            Black Marble- City Lights 2012
           </a>
           。值得一看。
          </p>
          <p>
           以前这夜间图可是只有军方卫星才能看到的，现在也可以娱乐大众了。
          </p>
          <blockquote>
           <p>
            A handful of scientists have observed earthly night lights over the past four decades with military satellites and astronaut photography. But in 2012, the view became significantly clearer. The
            <a href="http://npp.gsfc.nasa.gov/" target="_blank">
             Suomi National Polar-orbiting Partnership
            </a>
            (NPP) satellite — launched in October 2011 by NASA, the National Oceanic and Atmospheric Administration (NOAA), and the Department of Defense — carries a low-light sensor that can distinguish night lights with six times better spatial resolution and 250 times better resolution of lighting levels (dynamic range) than before. Also, because Suomi NPP is a civilian science satellite, data is available to scientists within minutes to hours of acquisition.
           </p>
          </blockquote>
          <p>
           白天的卫星数据我接触多了，但晚上的一直是望而却步。大数据来了，从原始数据到最后的图，每一步都有统计方法在支持。到最后，白天和黑夜的分别也不是那么明显了，那些方法还叫不叫统计也不重要了。
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 22:44
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/black-marble/" rel="tag">
           Black Marble
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/nasa/" rel="tag">
           NASA
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/virrs/" rel="tag">
           VIRRS
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%9c%b0%e7%90%83/" rel="tag">
           地球
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%9f%8e%e5%b8%82%e7%81%af%e5%85%89/" rel="tag">
           城市灯光
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%a4%a7%e6%95%b0%e6%8d%ae/" rel="tag">
           大数据
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-1847 post type-post status-publish format-standard hentry category-61 category-23 category-84 tag-181 tag-102 tag-101 category-61-id category-23-id category-84-id post-seq-8 post-parity-even meta-position-corners fix" id="post-1847">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2012/11/26/%e7%be%a4%e4%bd%93%e7%9a%84%e6%99%ba%e6%85%a7/" rel="bookmark" title="群体的智慧">
            群体的智慧
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/" rel="category tag">
             数据分析
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e6%8c%96%e6%8e%98/" rel="category tag">
             数据挖掘
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1/" rel="category tag">
             统计
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2012/11/26/%e7%be%a4%e4%bd%93%e7%9a%84%e6%99%ba%e6%85%a7/#comments">
             7 Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           11月
          </span>
          <span class="day">
           26
          </span>
          <span class="year">
           2012
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2012-11-26T23:48:02+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           首先声明：这里的群体只在数据分析范畴，不要瞎联想到社会实践中。不慎应用，后果自负。在说任何之前，先推荐一本书：
           <a href="http://book.douban.com/subject/4924898/" target="_blank">
            群体的智慧
           </a>
          </p>
          <p>
           <img src="http://img3.douban.com/lpic/s4507474.jpg"/>
          </p>
          <p>
           我也不知道翻译的水平如何，如果读不下去可以看
           <a href="http://www.amazon.com/Wisdom-Crowds-James-Surowiecki/dp/0385721706" target="_blank">
            原版的
           </a>
           。
          </p>
          <p>
           早就在想传播一下这个有趣的话题，但它实在是太大，太沉重，不知在哪个范围内讨论比较好。
           <a href="http://book.douban.com/subject/4924898/" target="_blank">
            群体的智慧
           </a>
           一书的开头就把这个话题扩大到民主决策和精英决策的对比，实在出乎我的准备范围。
          </p>
          <p>
           刚好又
           <a href="http://www.loyhome.com/我（对于统计方法）的一些偏见/" target="_blank">
            被人点名
           </a>
           ，
          </p>
          <blockquote>
           <p>
            再再再比如，没有假设简单的那些机器学习模型中，我最最最最无法认同的就是最粗暴的把
            <a href="http://www.loyhome.com/r%e5%b9%b6%e8%a1%8c%e5%81%9a%e5%a4%a7%e6%95%b0%e6%8d%ae%e6%97%b6%e9%97%b4%e5%ba%8f%e5%88%97%e5%88%86%e6%9e%90%e4%b8%8ebootstrap/" title="R并行做大数据时间序列分析与bootstrap">
             各种模型结果混合起来
            </a>
            ，用类似bootstrap的方法求得置信区间之类…这简直是就毫无办法之下的粗暴猜测嘛。
           </p>
           <p>
            然后最后一个问题，施老师说，这个某种程度上反映了“群体智慧”。呃，好吧，就算每个模型都提取了一定的信息量，然后这么混合起来就是万灵药了？怎么听怎么像中药一锅煮的感觉，而不是西药那么配方分明…
           </p>
          </blockquote>
          <p>
           那我就在我知道的数据分析的框架内来汇报一下。 我觉得（个人意见，个人意见）数理统计作为数据分析的一部分，基本上就是在用平均的想法争取把误差减小，让有用信号自己站出来。不管是参数估计，假设检验，各类回归，各类预测，时间空间，黑箱白箱，黑猫白猫。。。但是怎么平均就体现了各种方法的区别。
          </p>
          <p>
           那就先举个最粗暴的中药一锅煮的例子：
           <a href="http://zh.wikipedia.org/wiki/随机森林" target="_blank">
            随机森林
           </a>
           （Random Forest），
           <a href="http://en.wikipedia.org/wiki/Leo_Breiman" target="_blank">
            Loe Breiman
           </a>
           的大作。在做分类（classification）时，每次从已有数据中
           <em>
            <strong>
             随机选取
            </strong>
           </em>
           （bootstrap 或随机抽) 一部分观测值和
           <em>
            <strong>
             随机抽出一小部分变量
            </strong>
           </em>
           。在这个小数据上建个小的分类树。
           <em>
            <strong>
             独立重复
            </strong>
           </em>
           上面一步得到一批小的分类树。等有新的观测值要被分类时，把TA扔进各个弱小的分类树来分别做决定，最后让这些小树来
           <em>
            <strong>
             投个票
            </strong>
           </em>
           就行了。这没有任何模型和技术含量的天马流行算法行吗？实践证明它还真行。
          </p>
          <p>
           说了半天，这和群体的智慧有关系吗？我当然也不同意“就算每个模型都提取了一定的信息量，然后这么混合起来就是万灵药了”。何时可以利用群体的智慧也是有条件的。前人和现代人经验总结了
           <a href="http://en.wikipedia.org/wiki/The_Wisdom_of_Crowds" target="_blank">
            四条
           </a>
           ：
          </p>
          <table>
           <tbody>
            <tr>
             <td>
              Diversity of
              <a href="http://en.wikipedia.org/wiki/Opinion" title="Opinion">
               opinion
              </a>
             </td>
             <td>
              Each person should have private information even if it’s just an eccentric interpretation of the known facts.
             </td>
            </tr>
            <tr>
             <td>
              Independence
             </td>
             <td>
              People’s opinions aren’t determined by the opinions of those around them.
             </td>
            </tr>
            <tr>
             <td>
              Decentralization
             </td>
             <td>
              People are able to specialize and draw on local knowledge.
             </td>
            </tr>
            <tr>
             <td>
              Aggregation
             </td>
             <td>
              Some mechanism exists for turning private judgments into a collective
              <a href="http://en.wikipedia.org/wiki/Decision_making" title="Decision making">
               decision
              </a>
              .
             </td>
            </tr>
           </tbody>
          </table>
          <p>
           回头看一下，
           <a href="http://zh.wikipedia.org/wiki/随机森林" target="_blank">
            随机森林
           </a>
           不正是在试图复制用随机抽取观测值和变量来产生Diversity of opnion，用独立随机抽取来使小树们有自己的见解（Independece），用小树而不是线性模型来提取局部信息（Decentralization），用一树一票来民主集中（Aggregation）吗？
          </p>
          <p>
           所以我认为这个看来最粗暴黑箱子其实还是很透明的，而且是经过精心合理设计。中药一锅煮应该不会很有效，但煮什么，怎么煮还是很有学问的。煮好了没准搞出了凉茶什么的百病通杀呢（placebo effect)。
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 23:48
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/" rel="tag">
           数据分析
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e7%be%a4%e4%bd%93%e7%9a%84%e6%99%ba%e6%85%a7/" rel="tag">
           群体的智慧
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e9%9a%8f%e6%9c%ba%e6%a3%ae%e6%9e%97/" rel="tag">
           随机森林
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-1804 post type-post status-publish format-standard hentry category-3 tag-99 tag-100 category-3-id post-seq-9 post-parity-odd meta-position-corners fix" id="post-1804">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2012/10/02/%e6%95%b0%e5%ad%97%e4%b8%ad%e7%9a%84%e8%a7%84%e5%be%8b/" rel="bookmark" title="数字中的规律">
            数字中的规律
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e9%97%b2%e6%89%af/" rel="category tag">
             闲扯
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2012/10/02/%e6%95%b0%e5%ad%97%e4%b8%ad%e7%9a%84%e8%a7%84%e5%be%8b/#respond">
             No Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           10月
          </span>
          <span class="day">
           02
          </span>
          <span class="year">
           2012
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2012-10-02T10:43:50+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           由于一些无聊的原因，上周看了一下幼儿园升小学（择校时用的）面试试题。发现题还真是不简单，更无比惭愧的是有的题我居然也不会，而且还是数字题。
          </p>
          <p>
           首先
           <a href="http://gz.youjiao.com/e/20110715/4e1ffd1735081_2.shtml" target="_blank">
            有一道题
           </a>
           是这样的：
          </p>
          <blockquote>
           <p>
            22. 有1到9这9个数将他们分类。例如 1，3，5，7，9
            <strong>
             ％
            </strong>
            2，4，6，8 是按照奇数和偶数将他们分成两类的。
           </p>
           <p>
            现在问 1，3，7，8
            <strong>
             ％
            </strong>
            5，9
            <strong>
             ％
            </strong>
            2，4，6 是按照什么将他们分成3类的呢?
           </p>
          </blockquote>
          <p>
           我这成天摸数字的是绞尽脑汁也不知所云。
          </p>
          <p>
           还好儿时的教育教会了我们不懂就问，于是就网上问了一下。有好心人一句话点醒我梦中人。原来有一种灰常合理解释是这数字是按汉语拼音的音调分类的：前四个是一声，下两个是三声，最后三个是四声。
          </p>
          <p>
           <strong>
            不得不佩服，真是太有创造性了！
           </strong>
          </p>
          <p>
           感慨之余，我还联想到我今年春季被抓去参加的一个音乐系博士毕业答辩。这位女歌唱家的论文是关于怎么教外国歌唱爱好者（或歌唱家）唱中国歌的。简单的讲就是要为中文建立一个音标字母体系（International Phonetic Alphabet)， 这样只要看着音标就可以唱了，而不必懂中文的意思。
          </p>
          <p>
           答辩中，我问了一个后来发现很2的问题：“为什么这代表中文的音标字母体系没有音调呢？”
          </p>
          <p>
           歌唱家也是一句话点醒我梦中人，“唱歌时汉字是不分音调的，是随曲调的。” 咣当！居然我三十多年了还没发现这个。在脑子快速想了一下：讲话时“我3爱4你4中1国2” 到了唱歌时变成 “我1爱2你3中3国1”，没一个不变的，还真是随曲调的。同时也解释了为何在国外长大的小朋友学中文歌比学说汉语容易太多。
          </p>
          <p>
           学术一下的结论：歌曲语音识别和对话语音识别的复杂度相差很远。
          </p>
          <p>
           跑题一下的结论是：参加答辩还真是长知识！（论文中关于徐志摩的爱情故事也很详细，比理工科的论文可读性强很多）。
          </p>
          <p>
          </p>
          <p>
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 10:43
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/%e6%95%b0%e5%ad%97%e4%b8%b2/" rel="tag">
           数字串
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e9%9f%b3%e4%b9%90/" rel="tag">
           音乐
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-1787 post type-post status-publish format-standard hentry category-3 tag-98 tag-97 category-3-id post-seq-10 post-parity-even meta-position-corners fix" id="post-1787">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2012/08/17/%e4%b8%80%e7%82%b9%e5%9b%9e%e6%83%b3/" rel="bookmark" title="一点回想">
            一点回想
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e9%97%b2%e6%89%af/" rel="category tag">
             闲扯
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2012/08/17/%e4%b8%80%e7%82%b9%e5%9b%9e%e6%83%b3/#comments">
             4 Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           8月
          </span>
          <span class="day">
           17
          </span>
          <span class="year">
           2012
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2012-08-17T04:17:22+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           弹指一挥间，来美十二年。有些经历再不记下来就全忘了。
          </p>
          <p>
           依稀记得第一次走出旧金山机场时的拥挤。没头苍蝇般的乱撞出关，被接机同学找到就直奔东湾。接下来几天在各位前辈的帮助下渐渐安顿下来。幸运的续租了一位毕业的大侠留下的小屋。和这位大侠直到十年后在西安一个会议上同时给报告时才首次相见。
          </p>
          <p>
           第一次进办公室就把师姐的国籍从瑞典听到了瑞士，当天下午就被彬姐纠正错误和不认真的态度，算是首次见识。第二天到办公室就开始钻研概率，统计，英语，准备上课。几天下来也不知干了什么和该干什么。
          </p>
          <p>
           好不容易等到了上课，发现听英文没有课外时那么难。原来数学符号有时还是有用的，对我当时鸡同鸭讲的英文帮助挺大的。可问题是下了课就听不懂了也说不出了。彬姐当时给了几本她当时提高英语时的小册子，有些用，但最后最有用的还是她给的两条建议：1. 和美国同学玩；2.听广播。
          </p>
          <p>
           说起和同学玩，真得感谢系里的美国同学。他们每周都有几个下午组织大家在楼下的草坪上玩游戏（飞盘或门球 ：）。我们级的一个美国同学，Jason，每天下午都拉可以拉动的人去 gym 搬铁块，打壁球（友情提示：打壁球时一定要买副专门的保护眼镜，就不会像我第一次时就被打肿了眼睛）。在这些活动不仅消磨了时间，还大大地改善了英文表达能力。有时在闹笑话的同时也会学到很多日常生活和文化上的东西。记得Jason过生日时我们都做个菜去他家玩。我当然是啥也不会了，就在中国超市买了只鸡，塞进瓦罐里炖了几小时拿去。Jason见了大惊失色的问“这是神马？”原来在美国长大的小朋友是没见过鸡头的。
          </p>
          <p>
           听广播是另一个我觉得非常有用的学习英语的方法。提高听力，扩大词汇量的同时也可以让我了解美国人都关心什么家长里短。相比电视而言，广播开始时更难听懂，但更容易集中注意力。当时跑到 RaiodShack 去买了个像耳机一样的，走路或坐车时听，效果很好（只是要注意交通安全）。当年听彬姐说她们家没有有线电视时还很惊讶，发现自己这些年来也从没安装过。
          </p>
          <p>
           现在回想一下，来美第一年是对语言文化最好奇和最有动力学习的阶段。 错过了就错过了，错过了，错过了。感谢当时的老师同学给我提供那么多机会和快乐。
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 04:17
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/%e5%ad%a6%e4%b9%a0%e8%8b%b1%e6%96%87/" rel="tag">
           学习英文
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e7%95%99%e5%ad%a6/" rel="tag">
           留学
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <div class="page-nav fix">
        <span class="previous-entries">
         <a href="http://blog.cos.name/taoshi/author/taoshi/page/3/">
          <span class="icon">
          </span>
          Older Entries
         </a>
        </span>
        <span class="next-entries">
         <a href="http://blog.cos.name/taoshi/author/taoshi/">
          <span class="icon">
          </span>
          Newer Entries
         </a>
        </span>
       </div>
       <!-- page nav -->
      </div>
      <!-- content -->
     </div>
     <!-- main col -->
     <div class="sidebar-shell sidebar-shell-right" id="sidebar-shell-1">
      <div class="dbx-group right boxed warea" id="sidebar">
       <!--widget start -->
       <aside class="dbx-box suf-widget widget_recent_entries" id="recent-posts-2">
        <div class="dbx-content">
         <h3 class="dbx-handle plain">
          近期文章
         </h3>
         <ul>
          <li>
           <a href="http://blog.cos.name/taoshi/2014/05/25/%ef%bc%bb%e6%9c%9d%e8%8a%b1%e5%a4%95%e6%8b%be%ef%bc%bd%e4%bb%8e%e5%ad%a6%e4%b9%a0%e6%95%b0%e5%ad%a6%e5%85%ac%e5%bc%8f%e5%88%b0%e5%ae%9e%e8%b7%b5%e7%bb%9f%e8%ae%a1%e5%88%86%e6%9e%90/">
            [朝花夕拾] 从学习数学公式到实践统计分析
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2014/05/12/%e6%9c%9d%e8%8a%b1%e5%a4%95%e6%8b%be%ef%bc%9a%e8%bf%8e%e6%8e%a5%e4%bf%a1%e6%81%af%e6%97%b6%e4%bb%a3%e7%9a%84%e7%bb%9f%e8%ae%a1%e6%8c%91%e6%88%98/">
            [朝花夕拾] 迎接信息时代的统计挑战
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2014/04/13/%e5%a4%b1%e8%81%94%e6%90%9c%e6%95%91%e4%b8%ad%e7%9a%84%e7%bb%9f%e8%ae%a1%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/">
            失联搜救中的统计数据分析
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2014/02/13/%e6%96%b0%e5%b9%b4%e5%88%b0%ef%bc%8c%e5%8f%91%e7%ba%a2%e5%8c%85%ef%bc%88%e4%b9%8b%e4%b8%80%ef%bc%89%e5%a4%a7%e5%ae%b6%e5%a6%82%e4%bd%95%e5%8f%91%e7%ba%a2%e5%8c%85%ef%bc%9f/">
            新年到，发红包（之一）大家如何发红包？
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/10/03/%e7%bd%91%e4%b8%8a%e9%97%ae%e5%8d%b7%ef%bc%8c%e7%bc%ba%e5%a4%b1%e6%95%b0%e6%8d%ae%e5%92%8c%e6%95%b0%e6%8d%ae%e9%9a%90%e7%a7%81/">
            网上问卷，缺失数据和数据隐私
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/08/28/%e8%88%aa%e6%b5%b7%e5%ae%b61%e5%8f%b7%e7%a6%bb%e5%bc%80%e5%a4%aa%e9%98%b3%e7%b3%bb%e4%ba%86%e5%90%97%ef%bc%9f/">
            航海家1号离开太阳系了吗？
           </a>
          </li>
         </ul>
        </div>
       </aside>
       <!--widget end -->
       <!--widget start -->
       <aside class="dbx-box suf-widget widget_archive" id="archives-2">
        <div class="dbx-content">
         <h3 class="dbx-handle plain">
          文章归档
         </h3>
         <ul>
          <li>
           <a href="http://blog.cos.name/taoshi/2014/05/">
            2014年五月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2014/04/">
            2014年四月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2014/02/">
            2014年二月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/10/">
            2013年十月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/08/">
            2013年八月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/07/">
            2013年七月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/06/">
            2013年六月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/05/">
            2013年五月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/04/">
            2013年四月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/02/">
            2013年二月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/01/">
            2013年一月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/12/">
            2012年十二月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/11/">
            2012年十一月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/10/">
            2012年十月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/08/">
            2012年八月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/07/">
            2012年七月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/06/">
            2012年六月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/05/">
            2012年五月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/04/">
            2012年四月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/02/">
            2012年二月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2011/12/">
            2011年十二月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2011/11/">
            2011年十一月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2011/10/">
            2011年十月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2011/09/">
            2011年九月
           </a>
          </li>
         </ul>
        </div>
       </aside>
       <!--widget end -->
       <!--widget start -->
       <aside class="dbx-box suf-widget widget_categories" id="categories-2">
        <div class="dbx-content">
         <h3 class="dbx-handle plain">
          分类目录
         </h3>
         <ul>
          <li class="cat-item cat-item-91">
           <a href="http://blog.cos.name/taoshi/category/%e4%bd%93%e8%82%b2/">
            体育
           </a>
           (2)
          </li>
          <li class="cat-item cat-item-63">
           <a href="http://blog.cos.name/taoshi/category/%e5%aa%92%e4%bd%93%e6%8a%a5%e9%81%93/">
            媒体报道
           </a>
           (12)
          </li>
          <li class="cat-item cat-item-152">
           <a href="http://blog.cos.name/taoshi/category/%e6%95%99%e8%82%b2/">
            教育
           </a>
           (6)
          </li>
          <li class="cat-item cat-item-61">
           <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/">
            数据分析
           </a>
           (22)
          </li>
          <li class="cat-item cat-item-23">
           <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e6%8c%96%e6%8e%98/">
            数据挖掘
           </a>
           (7)
          </li>
          <li class="cat-item cat-item-62">
           <a href="http://blog.cos.name/taoshi/category/%e7%a7%91%e5%ad%a6/">
            科学
           </a>
           (7)
          </li>
          <li class="cat-item cat-item-84">
           <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1/">
            统计
           </a>
           (22)
          </li>
          <li class="cat-item cat-item-83">
           <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1%e5%92%a8%e8%af%a2/">
            统计咨询
           </a>
           (3)
          </li>
          <li class="cat-item cat-item-66">
           <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1%e5%ba%94%e7%94%a8/">
            统计应用
           </a>
           (15)
          </li>
          <li class="cat-item cat-item-76">
           <a href="http://blog.cos.name/taoshi/category/%e8%81%8c%e4%b8%9a%e4%bb%8b%e7%bb%8d/">
            职业介绍
           </a>
           (5)
          </li>
          <li class="cat-item cat-item-124">
           <a href="http://blog.cos.name/taoshi/category/%e8%af%bb%e4%b9%a6/">
            读书
           </a>
           (2)
          </li>
          <li class="cat-item cat-item-77">
           <a href="http://blog.cos.name/taoshi/category/%e8%bd%ac%e8%bd%bd/">
            转载
           </a>
           (1)
          </li>
          <li class="cat-item cat-item-3">
           <a href="http://blog.cos.name/taoshi/category/%e9%97%b2%e6%89%af/">
            闲扯
           </a>
           (14)
          </li>
         </ul>
        </div>
       </aside>
       <!--widget end -->
       <!--widget start -->
       <aside class="dbx-box suf-widget widget_links" id="linkcat-125">
        <div class="dbx-content">
         <h3 class="dbx-handle plain">
          链接链接
         </h3>
         <ul class="xoxo blogroll">
          <li>
           <a href="http://www.statsblogs.com">
            Statsblogs
           </a>
          </li>
          <li>
           <a href="http://www.matrix67.com/blog/">
            Matrix67
           </a>
          </li>
          <li>
           <a href="http://cos.name">
            统计之都
           </a>
          </li>
          <li>
           <a href="http://www.itongji.cn">
            中国统计网
           </a>
          </li>
          <li>
           <a href="http://www.loyhome.com">
            落园
           </a>
          </li>
          <li>
           <a href="http://yihui.name/cn/">
            歇一会
           </a>
          </li>
          <li>
           <a href="http://yixuan.cos.name/cn/">
            怡然軒
           </a>
          </li>
          <li>
           <a href="http://www.puddingnnn.com">
            他山布丁
           </a>
          </li>
          <li>
           <a href="http://www.bjt.name">
            刘思喆@贝吉塔行星
           </a>
          </li>
          <li>
           <a href="http://blog.sciencenet.cn/home.php?mod=space&amp;uid=2024">
            熵.复杂程度.统计.气象.水
           </a>
          </li>
         </ul>
        </div>
       </aside>
       <!--widget end -->
       <!--widget start -->
       <aside class="dbx-box suf-widget widget_tag_cloud" id="tag_cloud-2">
        <div class="dbx-content">
         <h3 class="dbx-handle plain">
          Tags
         </h3>
         <div class="tagcloud">
          <a class="tag-link-60 tag-link-position-1" href="http://blog.cos.name/taoshi/tag/5%cf%83/" style="font-size: 8pt;" title="1个话题">
           5σ
          </a>
          <a class="tag-link-8 tag-link-position-2" href="http://blog.cos.name/taoshi/tag/air-pollution/" style="font-size: 8pt;" title="1个话题">
           air pollution
          </a>
          <a class="tag-link-24 tag-link-position-3" href="http://blog.cos.name/taoshi/tag/berkeley/" style="font-size: 22pt;" title="5个话题">
           Berkeley
          </a>
          <a class="tag-link-4 tag-link-position-4" href="http://blog.cos.name/taoshi/tag/black-box/" style="font-size: 8pt;" title="1个话题">
           black box
          </a>
          <a class="tag-link-138 tag-link-position-5" href="http://blog.cos.name/taoshi/tag/critical-thinking/" style="font-size: 13.25pt;" title="2个话题">
           critical thinking
          </a>
          <a class="tag-link-139 tag-link-position-6" href="http://blog.cos.name/taoshi/tag/david-a-freedman/" style="font-size: 16.75pt;" title="3个话题">
           David A. Freedman
          </a>
          <a class="tag-link-44 tag-link-position-7" href="http://blog.cos.name/taoshi/tag/discovery/" style="font-size: 8pt;" title="1个话题">
           discovery
          </a>
          <a class="tag-link-9 tag-link-position-8" href="http://blog.cos.name/taoshi/tag/fine-particulate-matter/" style="font-size: 8pt;" title="1个话题">
           fine particulate matter
          </a>
          <a class="tag-link-53 tag-link-position-9" href="http://blog.cos.name/taoshi/tag/leo-breiman/" style="font-size: 8pt;" title="1个话题">
           Leo Breiman
          </a>
          <a class="tag-link-10 tag-link-position-10" href="http://blog.cos.name/taoshi/tag/meta-analysis/" style="font-size: 8pt;" title="1个话题">
           meta-analysis
          </a>
          <a class="tag-link-18 tag-link-position-11" href="http://blog.cos.name/taoshi/tag/national-public-radio/" style="font-size: 8pt;" title="1个话题">
           national public radio
          </a>
          <a class="tag-link-19 tag-link-position-12" href="http://blog.cos.name/taoshi/tag/npr/" style="font-size: 8pt;" title="1个话题">
           NPR
          </a>
          <a class="tag-link-54 tag-link-position-13" href="http://blog.cos.name/taoshi/tag/peter-bickel/" style="font-size: 8pt;" title="1个话题">
           Peter Bickel
          </a>
          <a class="tag-link-11 tag-link-position-14" href="http://blog.cos.name/taoshi/tag/pm2-5/" style="font-size: 8pt;" title="1个话题">
           pm2.5
          </a>
          <a class="tag-link-6 tag-link-position-15" href="http://blog.cos.name/taoshi/tag/prediction/" style="font-size: 8pt;" title="1个话题">
           prediction
          </a>
          <a class="tag-link-30 tag-link-position-16" href="http://blog.cos.name/taoshi/tag/probability/" style="font-size: 8pt;" title="1个话题">
           probability
          </a>
          <a class="tag-link-12 tag-link-position-17" href="http://blog.cos.name/taoshi/tag/ralph-kahn/" style="font-size: 8pt;" title="1个话题">
           Ralph Kahn
          </a>
          <a class="tag-link-13 tag-link-position-18" href="http://blog.cos.name/taoshi/tag/satellite/" style="font-size: 8pt;" title="1个话题">
           satellite
          </a>
          <a class="tag-link-45 tag-link-position-19" href="http://blog.cos.name/taoshi/tag/social-study/" style="font-size: 8pt;" title="1个话题">
           social study
          </a>
          <a class="tag-link-179 tag-link-position-20" href="http://blog.cos.name/taoshi/tag/statistics/" style="font-size: 16.75pt;" title="3个话题">
           Statistics
          </a>
          <a class="tag-link-20 tag-link-position-21" href="http://blog.cos.name/taoshi/tag/super-bowl-ads/" style="font-size: 8pt;" title="1个话题">
           Super Bowl Ads
          </a>
          <a class="tag-link-26 tag-link-position-22" href="http://blog.cos.name/taoshi/tag/terry-speed/" style="font-size: 8pt;" title="1个话题">
           Terry Speed
          </a>
          <a class="tag-link-46 tag-link-position-23" href="http://blog.cos.name/taoshi/tag/twitter-2/" style="font-size: 8pt;" title="1个话题">
           Twitter
          </a>
          <a class="tag-link-14 tag-link-position-24" href="http://blog.cos.name/taoshi/tag/yang-liu/" style="font-size: 8pt;" title="1个话题">
           Yang Liu
          </a>
          <a class="tag-link-31 tag-link-position-25" href="http://blog.cos.name/taoshi/tag/%e4%ba%ba%e5%8f%a3%e6%99%ae%e6%9f%a5/" style="font-size: 8pt;" title="1个话题">
           人口普查
          </a>
          <a class="tag-link-93 tag-link-position-26" href="http://blog.cos.name/taoshi/tag/%e5%8f%b6%e8%af%97%e6%96%87/" style="font-size: 13.25pt;" title="2个话题">
           叶诗文
          </a>
          <a class="tag-link-114 tag-link-position-27" href="http://blog.cos.name/taoshi/tag/%e5%a4%a7%e6%95%b0%e6%8d%ae/" style="font-size: 19.666666666667pt;" title="4个话题">
           大数据
          </a>
          <a class="tag-link-74 tag-link-position-28" href="http://blog.cos.name/taoshi/tag/%e5%a5%a5%e6%9e%97%e5%8c%b9%e5%85%8b/" style="font-size: 16.75pt;" title="3个话题">
           奥林匹克
          </a>
          <a class="tag-link-58 tag-link-position-29" href="http://blog.cos.name/taoshi/tag/%e5%b8%8c%e6%a0%bc%e6%96%af%e7%8e%bb%e8%89%b2%e5%ad%90/" style="font-size: 8pt;" title="1个话题">
           希格斯玻色子
          </a>
          <a class="tag-link-21 tag-link-position-30" href="http://blog.cos.name/taoshi/tag/%e5%b9%bf%e5%91%8a/" style="font-size: 8pt;" title="1个话题">
           广告
          </a>
          <a class="tag-link-22 tag-link-position-31" href="http://blog.cos.name/taoshi/tag/%e6%83%85%e7%bb%aa%e9%a2%84%e6%b5%8b/" style="font-size: 8pt;" title="1个话题">
           情绪预测
          </a>
          <a class="tag-link-180 tag-link-position-32" href="http://blog.cos.name/taoshi/tag/%e6%95%b0%e6%8d%ae%e6%8c%96%e6%8e%98/" style="font-size: 13.25pt;" title="2个话题">
           数据挖掘
          </a>
          <a class="tag-link-47 tag-link-position-33" href="http://blog.cos.name/taoshi/tag/%e6%96%b0%e6%b5%aa%e6%96%b0%e9%97%bb/" style="font-size: 8pt;" title="1个话题">
           新浪新闻
          </a>
          <a class="tag-link-59 tag-link-position-34" href="http://blog.cos.name/taoshi/tag/%e6%ac%a7%e6%b4%b2%e5%a4%a7%e5%9e%8b%e5%bc%ba%e5%ad%90%e5%af%b9%e6%92%9e%e6%9c%ba/" style="font-size: 8pt;" title="1个话题">
           欧洲大型强子对撞机
          </a>
          <a class="tag-link-15 tag-link-position-35" href="http://blog.cos.name/taoshi/tag/%e6%b0%91%e7%a7%91/" style="font-size: 8pt;" title="1个话题">
           民科
          </a>
          <a class="tag-link-27 tag-link-position-36" href="http://blog.cos.name/taoshi/tag/%e7%94%b7%e5%a5%b3%e6%af%94%e4%be%8b/" style="font-size: 8pt;" title="1个话题">
           男女比例
          </a>
          <a class="tag-link-48 tag-link-position-37" href="http://blog.cos.name/taoshi/tag/%e7%95%99%e5%ad%a6%e7%94%b3%e8%af%b7/" style="font-size: 8pt;" title="1个话题">
           留学申请
          </a>
          <a class="tag-link-50 tag-link-position-38" href="http://blog.cos.name/taoshi/tag/%e7%b2%be%e7%ae%97%e5%b8%88/" style="font-size: 8pt;" title="1个话题">
           精算师
          </a>
          <a class="tag-link-183 tag-link-position-39" href="http://blog.cos.name/taoshi/tag/%e7%bb%9f%e8%ae%a1/" style="font-size: 19.666666666667pt;" title="4个话题">
           统计
          </a>
          <a class="tag-link-51 tag-link-position-40" href="http://blog.cos.name/taoshi/tag/%e7%bb%9f%e8%ae%a1%e5%ad%a6%e5%ae%b6/" style="font-size: 8pt;" title="1个话题">
           统计学家
          </a>
          <a class="tag-link-64 tag-link-position-41" href="http://blog.cos.name/taoshi/tag/%e7%bd%ae%e4%bf%a1%e5%8c%ba%e9%97%b4/" style="font-size: 13.25pt;" title="2个话题">
           置信区间
          </a>
          <a class="tag-link-17 tag-link-position-42" href="http://blog.cos.name/taoshi/tag/%e8%b6%85%e7%ba%a7%e7%a2%97/" style="font-size: 8pt;" title="1个话题">
           超级碗
          </a>
          <a class="tag-link-41 tag-link-position-43" href="http://blog.cos.name/taoshi/tag/%e9%92%9f%e5%b1%b1%e8%af%b4%e4%ba%8b/" style="font-size: 8pt;" title="1个话题">
           钟山说事
          </a>
          <a class="tag-link-16 tag-link-position-44" href="http://blog.cos.name/taoshi/tag/%e9%9d%9e%e8%af%9a%e5%8b%bf%e6%89%b0/" style="font-size: 8pt;" title="1个话题">
           非诚勿扰
          </a>
          <a class="tag-link-42 tag-link-position-45" href="http://blog.cos.name/taoshi/tag/%e9%ab%98%e8%80%83/" style="font-size: 8pt;" title="1个话题">
           高考
          </a>
         </div>
        </div>
       </aside>
       <!--widget end -->
       <!--widget start -->
       <aside class="dbx-box suf-widget widget-suf-subscription" id="suf-subscription-2">
        <div class="dbx-content">
         <h3 class="dbx-handle plain">
          Follow Me
         </h3>
         <form action="http://feedburner.google.com/fb/a/mailverify" class="aligncenter" method="post" onsubmit="window.open('http://feedburner.google.com/fb/a/mailverify?uri=your-feed-name', 'popupwindow', 'scrollbars=yes,width=550,height=520');return true" target="popupwindow">
          <p>
          </p>
         </form>
         <div class="fix">
         </div>
        </div>
       </aside>
       <!--widget end -->
       <!--widget start -->
       <aside class="dbx-box suf-widget widget_meta" id="meta-2">
        <div class="dbx-content">
         <h3 class="dbx-handle plain">
          功能
         </h3>
         <ul>
          <li>
           <a href="http://blog.cos.name/taoshi/wp-login.php">
            登录
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/feed/">
            文章
            <abbr title="Really Simple Syndication">
             RSS
            </abbr>
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/comments/feed/">
            评论
            <abbr title="Really Simple Syndication">
             RSS
            </abbr>
           </a>
          </li>
          <li>
           <a href="https://cn.wordpress.org/" title="基于WordPress，一个优美、先进的个人信息发布平台。">
            WordPress.org
           </a>
          </li>
         </ul>
        </div>
       </aside>
       <!--widget end -->
      </div>
      <!--/sidebar -->
     </div>
    </div>
    <!-- /container -->
    <footer>
     <div id="cred">
      <table>
       <tbody>
        <tr>
         <td class="cred-left">
          © 2013
          <a href="http://blog.cos.name/taoshi">
           从数据中看规律
          </a>
         </td>
         <td class="cred-center">
         </td>
         <td class="cred-right">
          <a href="http://aquoid.com/news/themes/suffusion/">
           Suffusion theme by Sayontan Sinha
          </a>
         </td>
        </tr>
       </tbody>
      </table>
     </div>
    </footer>
    <!-- 63 queries, 49MB in 0.519 seconds. -->
   </div>
   <!--/wrapper -->
   <!-- location footer -->
  </div>
 </body>
</html>